訓練數據：教會AI做決策的原材料

2024 iThome 鐵人賽

DAY 13

生成式 AI

阿嬤也能懂的AI世界：30個生成式AI與Google Apps Script核心觀念系列第 13 篇

16th鐵人賽

iron_man

團隊Three Bears

2024-09-26 10:19:30

147 瀏覽

分享至

假如你要學習做一道新菜，可能是阿嬤的拿手好菜「紅燒肉」。你會怎麼學？你可能會先看食譜，然後跟著阿嬤一起在廚房裡動手做，觀察她的每一個步驟，從選食材、調味、到掌控火候，全部學起來。這些「觀察」和「練習」的過程，其實就像是AI學習時所需要的「訓練數據」。

訓練數據就是教會AI如何做決策的原材料。它就像是AI的食譜和練習場，透過大量的數據，AI才能夠學會如何辨識物體、做出預測，甚至幫你規劃下一次的購物清單。這些數據可以是圖片、文字、聲音，甚至是你每天點擊網頁的紀錄。

我們一起來看一個實際的案例：當AI要學習辨識貓和狗的圖片時，訓練數據就是成千上萬張的貓和狗的照片。每一張照片都標示了「這是貓」或「這是狗」。透過這些標記，AI學會了不同特徵的辨識，像是貓的尖耳朵、狗的毛色等。每一次AI判斷錯誤時，就像是在廚房裡不小心加錯了調味料，系統會重新調整，學習並改進，直到能準確辨識貓狗為止。

訓練數據的質量直接影響AI的表現。如果數據不夠豐富或不夠精確，AI就容易學錯。例如，如果你只給AI看白貓和黑狗的照片，那麼AI可能會以為所有貓都是白的、狗都是黑的，這樣的AI就不能應付現實中的各種情況。

這就像學習做菜一樣，如果你一直跟著一位口味偏重的廚師學習，你做出來的菜可能也會偏鹹。所以，為了讓AI有更廣泛的能力，訓練數據必須多樣化，包含不同的情境和變化，這樣AI才能適應各種情況。

在日常生活中，你可能無意間也成為了訓練AI的一部分。像是當你使用語音助手時，每次你與它對話的錄音，都可能成為AI改善語音識別的訓練數據。這些數據幫助AI了解各種口音、語速和語法，讓它能夠更準確地理解你的指令。

另一個例子是社群媒體平台的推薦系統。當你瀏覽、點讚或分享某些內容時，這些互動行為會被收集成為訓練數據，用來預測你可能感興趣的內容，然後平台再根據這些數據進行推送。這就是為什麼當你看過某類影片後，接下來會不斷看到類似影片的原因。

雖然訓練數據對於AI的學習至關重要，但在蒐集和使用這些數據時，也必須注意隱私和公平性。例如，如果訓練數據中出現偏見，AI也會學到這些偏見，進而做出不公平的判斷。因此，蒐集高質量、多元且具代表性的數據，是確保AI能正確運作的關鍵。

訓練數據是教會AI如何思考和做決策的基礎。就像阿嬤的紅燒肉食譜一樣，好的數據能讓AI變得更加聰明、靈活，而不好的數據則可能會讓AI做出錯誤的判斷。因此，蒐集和篩選訓練數據，是開發AI系統的第一步。

AI 模型：你看不見的人工智慧決策機器

微調：讓AI變得更聰明的進階訓練

系列文

阿嬤也能懂的AI世界：30個生成式AI與Google Apps Script核心觀念共 30 篇

RSS系列文訂閱系列文

2 人訂閱

完整目錄

直播研討會

{{ item.channelVendor }} {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22195 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

阿嬤也能懂的AI世界：30個生成式AI與Google Apps Script核心觀念系列 第 13 篇